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摘要 : [目的 /意义 ] 从 知识 融合 的 角度 切入 ,解决 政府 网 站 信息 资源 的 分 散 性 、 海 量 性 与 公众 知识 需求 的 
完整 性 、 精 准 化 之 间 的 矛盾 ,为 用 户 提供 更 为 有 效 的 决策 支持 ,提高 政府 网 站 信息 资源 的 利用 效率 。 [ 方法 “过 
程 ] 阐述 政府 网 站 信息 资源 的 内 涵 及 其 价值 需求 ,剖析 知识 融合 的 研究 进展 ,在 此 基础 上 分 析 政 府 网 站 信息 资 
源 知识 融合 的 流程 ,根据 流程 设计 “数据 级 融合 -概念 级 融合 -决策 级 融合 ”的 多 层次 的 政府 网 站 信息 资源 知 
识 融 合体 系 架构 ,并 为 每 个 具体 层次 构建 相应 的 运行 框架 。[ 结果 /结论 ] 设 计 出 的 政府 网 站 信息 资源 知识 融合 
体系 架构 ,为 后 续 的 扩展 性 与 深入 性 研究 提供 理论 支持 与 借鉴 。 
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中 国政 府 网 数据 显示 ,截至 2017 年 12 月 1 日 ,全 
国正 在 运行 的 政府 网 站 已 达到 24 820 家 ,如 此 规模 的 
网 站 数量 必然 会 产生 大 量 的 政府 网 站 信息 资源 。 以 北 
衰 为 例 ,2017 年 北京 市 各 级 政府 主动 公开 政府 信息 共 
143955 万 条 ,其 中 通过 政府 网 站 公开 信息 数 665 500 
条 ,出 总 数 的 37.18%" 。 为 了 进一步 了 解 北京 市 政 
府 殉 站 公开 信息 资源 的 利用 状况 ,我 们 以 热 词 “交通 拥 
志和 在 北京 市 政府 网 站 进行 检索 , 按 相关 度 排 序 , 共 得 
出 五 ? 336 条 结果 ,并 且 可 以 看 出 各 区 治理 实况 .相关 
座谈 会 .调研 情况 等 各 个 层面 的 信息 交织 在 一 起 ,为 用 
卢 粳 准 把 握 所 需 信息 造成 障碍 。 

可 见 ,政府 网 站 信息 资源 的 爆炸 式 增 长 在 为 公众 
提供 更 丰富 信息 的 同时 ,也 呈现 出 宛 余 度 高 .分散 性 强 
和 关联 度 低 等 制约 性 特点 ,这 些 制约 性 特点 导致 公众 
在 海量 的 政府 网 站 信息 中 选择 有 价值 信息 的 能 力 被 弱 
化 ,从 而 使 他 们 产生 选择 困难 焦虑 和 阅读 筛选 障碍 ,而 
“知识 融合 ”理论 的 出 现 和 不 断 发 展 ,为 政府 部 门 解决 
此 难题 开辟 了 一 条 新 的 道路 。 知 识 融合 的 目的 在 于 将 
大 量 动态 ,多 源 及 分 散 的 信息 资源 进行 深度 挖掘 与 组 


1 政府 网 站 信息 资源 的 价值 需求 


1.1 政府 网 站 信息 资源 概念 
政府 网 站 信息 资源 是 指 由 各 个 政府 部 门 在 其 相应 
的 政府 门户 网 站 上 发 布 的 面向 广大 群众 的 数字 资源 ， 
这 些 数字 资源 涵盖 了 经 济 .教育 .管理 和 服务 等 各 个 方 
面 , 且 具 有 公开 性 时 效 性 、 权 威 性 和 易 逝 性 等 特点 。 
随 着 网 络 新 媒体 和 移动 新 媒体 的 兴起 与 成 熟 , 越 来 越 
多 的 政府 部 门将 政府 网 站 作为 其 发 布 政务 信息 的 前 沿 
阵地 。 
1.2 政府 网 站 信息 资源 的 价值 需求 
政府 网 站 信息 资源 的 价值 是 政府 部 门 价值 需求 满 
足 程度 的 主观 感受 ,整个 价值 需求 的 过 程 与 公众 的 信 
息 知识 需求 直接 对 接 。 具 体 表现 在 以 下 3 个 方面 : 
(1) 资 源 内 容 的 广泛 性 需求 。 政 府 网 站 信息 资源 
内 容 覆 盖 的 广泛 程度 直接 影响 公众 获取 信息 资源 的 广 
度 。 以 中 国 公开 信息 整合 服务 平台 为 例 ,其 信息 资源 
的 领域 跨度 较 大 ,包括 财政 金融 审计 信息 ,港澳 台 侨 工 
作 信 息 .国防 信息 ,城乡 建设 与 环境 保护 信息 、 科 技 教 


织 , 实 现 知识 的 再 生 、 增 值 和 创新 ,这 一 定位 与 政府 网 
站 信息 资源 组 织 与 利用 过 程 相 一 致 ,能 进一步 优化 政 
府 网 站 的 知识 服务 效果 。 


育 信息 \ 民 族 宗 教 信息 、 卫 生体 育 信 息 、 综 合 政 务 信 息 
等 22 个 主题 的 信息 ,其 中 记录 数 最 多 的 城乡 建设 与 环 
境 保护 信息 高 达 786 187 条 ,记录 数 最 少 的 国防 信息 也 
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达到 了 18 350 条 ,广泛 的 信息 资源 是 保证 公民 和 政府 
满足 基本 信息 资源 价值 需求 的 基础 条 件 5 。 

(2) 资 源 功能 的 多 样 化 与 精准 化 需求 。 这 要 求 政 
府 网 站 与 移动 终端 及 社交 平台 充分 对 接 ""。 随 着 移动 
终端 及 社交 媒体 技术 的 不 断 成 熟 ,移动 政务 也 成 为 政 
府 网 站 的 考核 指标 之 一 ,根据 清华 大 学 对 全 国 415 家 
政府 门户 网 站 的 抽样 调查 ,2017 年 59.2% 的 网 站 建设 
了 政务 微 信 , 其 中 ,12. 8% 的 政务 微 信 更 新 频率 较 低 ， 
27. 2% 尚未 建立 政务 微 信 ;28.4% 的 网 站 建设 了 APP 
且 更 新 状况 较 好 ,22.2% 的 APP 更 新 频率 较 低 ,49.4% 
尚未 建设 APP5 。 政 府 网 站 接 人 移动 终端 和 社交 平 
台 ,保证 了 资源 功能 的 多 样 化 与 精准 化 ,是 政府 网 站 信 
息 资源 建设 的 又 一 价值 需求 。 

一 (3 ) 资 源 价值 的 综合 需求 性 。 这 种 综合 需求 体现 
在 本 用 性 ,更 新 性 .关联 性 和 实用 性 等 各 个 方面 ,另外 ， 
综合 需求 性 直接 与 公众 获取 政府 网 站 信息 资源 的 效率 
权 稳 ,因此 ,政府 部 门 需要 全 面 关 联 和 整合 服务 资源 ， 
从 而 最 大 程度 地 满足 公众 的 综合 价值 需求 。 

OO 政府 网 站 信息 资源 的 价值 需求 决定 了 政府 网 站 信 
后 殉 源 数量 庞大 范围 广泛 .信息 元 杂 等 特点 ,因此 , 借 
助 知识 融合 手段 来 形成 符合 用 户 需求 ` 基 于 逻辑 关系 
捕 琳 识 产品 刻不容缓 。 


2 ”知识 融合 及 其 研究 进展 


><“ 知 识 融 合 "这 一 概念 源 自 于 知识 工程 领域 ,经 历 
了 数据 融合 到 信息 融合 再 到 知识 融合 的 过 程 ,于 20 世 
纪 :90 年 代 正 式 得 到 相关 学 者 的 关注 和 研究 ,图书 情 
报 领域 内 的 知识 融合 研究 是 在 知识 科学 的 视角 下 进行 
的 "1。 当 前 国内 外 对 知识 融合 的 内 涵 并 没有 统一 界 
定 ,本 文 在 结合 多 位 学 者 观点 的 基础 上 ,总 结 认为 : 当 
前 阶段 的 知识 融合 是 一 种 关于 信息 资源 组 织 和 整合 的 
研究 范式 ,是 一 种 技术 工具 和 思维 模式 ,知识 融合 针对 
的 对 象 是 动态 .多 源 和 分 散 的 知识 ,运用 语义 网 ,关联 
数据 和 数据 挖掘 等 手段 对 对 象 知识 进行 抽取 、 匹 配 和 
集成 处 理 ,弱化 甚至 消除 对 象 知识 的 动态 性 ,多 源 性 和 
分 散 性 的 特点 ,最 终 形成 新 的 知识 层 ,实现 知识 增值 。 
通过 文献 阅读 , 本文 将 学 术 界 关于 知识 融合 的 研究 方 
向 总 结 为 由 外 而 内 的 4 个 层次 的 研究 , 即 大 数据 环境 
层次 .融合 系统 框架 层次 .关键 技术 层次 ,应 用 实践 层 
次 ,如 图 1 所 示 。 除 此 之 外 ,本 文 还 对 政府 网 站 领域 内 
的 知识 融合 研究 进展 进行 了 梳理 。 
2.1 ”知识 融合 与 大 数据 环境 的 联合 探究 

将 知识 融合 置 于 大 数据 环境 中 进行 研究 是 时 代 潮 


图 1 学 术 界 知识 融合 研究 的 4 个 层次 


流 所 需 。 近 年 来 ,学 术 界 相关 学 者 根据 大 数据 环境 下 
这 息 资 源 数 量 庞 大 ,结构 复杂 等 特点 ,将 知识 融合 看 
作 大 数据 时 代 知识 服务 的 增长 点 “ ,并 认为 大 数据 环 
境 下 的 知识 融合 环节 发 生 了 一 定 的 新 变化 " ,这 些 新 
变化 的 出 现 促 进 了 一 些 面 向 大 数据 环境 的 知识 融合 框 
架 的 重 构 。 壁 如 , 范 匡 将 知识 融合 的 过 程 模型 应 用 于 
大 数据 知识 服务 框架 中 ,把 知识 融合 、 知 识 服务 和 大 数 
据 三 者 有 效 地 结合 起 来 ,不 仅 较 好 地 满足 了 用 户 个 性 
化 、 创 新 型 的 需求 ,更 为 相关 研究 提供 了 一 定 的 理论 文 
撑 "… 。 王 日 芬 则 从 知识 生态 重 构 的 角度 对 大 数据 时 
代 的 知识 融合 关键 问题 进行 了 分 析 , 并 构建 了 DIKW 
价值 链 视 角 下 的 面向 知识 生态 重 构 和 学 科 创 新 服务 的 
知识 融合 流程 与 框架 ” 。 
2.2 知识 融合 的 系统 框架 构建 研究 

知识 融合 框架 和 知识 融合 系统 的 构建 为 知识 融 
研究 提供 了 逻辑 起 点 和 统一 支持 。 在 知识 融合 框架 能 
构建 方面 , 房 小 可 以 开放 世界 的 视角 审视 知识 融合 研 
究 ,为 突破 多 源 词 表 存在 的 异 构 性 和 知识 扩展 局 限 ,她 
在 波 普尔 世界 理论 的 基础 上 论证 了 知识 融合 范式 ,并 
提出 面向 多 源 词 表 融合 的 框架 体系 “MtFFO””。 在 
知识 融合 系统 方面 ,最 具 代 表 性 的 是 P. M. Gray 团队 
建设 的 KRAFT( Knowledge Reuse and Fusion Transform ) 
系统 ,该 系统 开辟 了 知识 融合 系统 架构 的 先河 ,为 之 后 
相关 系统 的 建设 商定 了 强 有 力 的 基础 。 在 此 之 后 ， 
A. Nikolov 等 人 建立 了 KnoFUSS 系统 ,该 知识 融合 
系统 结合 了 应 用 问题 解决 方法 技术 ,根据 不 同 的 领域 
和 任务 ,选择 不 同 的 方法 解决 问题 。 
2.3 知识 融合 的 关键 技术 解析 

知识 融合 的 关键 技术 指 的 是 实现 知识 融合 的 一 系 
列 算 法 研究 ,主要 集中 在 语义 规则 .主题 图 、 模 糊 集 理 
论 、 贝 叶 斯 网 络 和 数据 挖 气 等 方面 。 例 如 , 纸 锦 设计 了 
一 种 基于 本 体 论 和 语义 规则 的 知识 融合 算法 ,提高 了 
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知识 融合 结果 的 准确 性 ” ;和 鲁 慧 民 基于 全 信息 理论 ， 
对 传统 主题 图 模式 进行 了 元 素 间 结构 的 扩展 ,并 设计 
了 一 种 面向 多 源 异 构 知识 融合 的 扩展 主题 图 相似 性 算 
法 ; 韩 立 岩 将 信息 融合 处 理 技术 移植 到 知识 融合 处 
理 中 ,形成 基于 模糊 集 理论 的 知识 融合 算法 ,并 得 出 了 
相关 的 处 理 流程 和 基于 Petri 网 的 融合 模型 ;FE. 
Santos 等 人 将 概率 模型 与 传统 意义 上 的 贝 叶 斯 网 络 相 
结合 ,使 概率 模型 成 功 转化 为 由 叶 斯 知识 基础 ,最 终 提 
出 了 贝 叶 斯 知识 融合 算法 "” 。 
2.4 ”知识 融合 的 应 用 实践 探讨 

近年 来 ,知识 融合 的 应 用 实践 研究 也 如 雨后春笋 
般 出 现 , 且 涉及 的 领域 十 分 广泛 ,包括 图 书 情报 与 档案 
管理 领域 .电子 制造 领域 .军事 领域 .计算 机 科学 领域 
等 一 辟 如 , 唐 晓 波 将 知识 融合 应 用 于 个 性 化 商品 推荐 
中 q 难 消费 价值 的 角度 深度 分 析 了 商品 特征 ,挖掘 出 用 
户 仿 好 ,利用 DS 证 据 理论 对 传统 协同 过 滤 和 知识 过 滤 
推荐 算法 进行 融合 ,实现 了 个 性 化 推荐 ;ASmimov 
等 并 利用 分 布 式 知识 的 网 络 方法 ,对 知识 融合 .多 A- 
geob 结 构 等 进行 分 析 , 完 成 了 知识 融合 技术 在 电子 制 
遂 玩 域 的 应 用 ; 沈 旺 将 知识 融合 引入 数字 参考 咨询 
及 所 ,以 领域 本 体 映射 技术 为 依托 抽取 、 清 洗 和 匹配 知 
调 朴 体 库 , 并 对 所 形成 的 元 知识 集 进行 知识 融合 ,在 此 
基础 上 完成 数字 参考 咨询 知识 融合 框架 的 构建 ,增强 
工 烧 字 参 考 咨询 服务 能 力 ” ;成 全 通过 引入 “知识 因 
诊 移 概念 ,根据 网 络 社区 成 员 协 作 的 不 同 实现 形式 提 
出 多 促进 专家 知识 创新 为 目标 的 基于 协同 标注 的 知识 
融 容 实 现 机 制 *。 
2. 人 9 政府 网 站 知识 融合 研究 进展 

虽然 对 政府 网 站 的 信息 资源 进行 知识 融合 研究 具 
备 一 定 的 合理 性 和 科学 性 ,但 是 就 目前 而 言 ,学术 界 对 
该 方面 的 研究 还 未 形成 较为 成 熟 的 体系 ,学 者 们 往往 
侧重 于 运用 知识 融合 某 一 阶段 的 理论 或 技术 来 解决 政 
府 网 站 不 同 对 象 信息 资源 的 某 些 融合 问题 。 例 如 , 赵 
慧 针 对 政府 网 站 信息 资源 的 “内 孤岛 化 "问题 ,运用 信 
息 构建 理论 设计 了 政府 网 站 信息 资源 的 评价 指标 体 
系 , 旨 在 将 碎片 化 的 处 于 混沌 的 政府 网 站 信息 资源 进 
行 逻 辑 上 的 梳理 ,从 而 使 政府 网 站 信息 资源 呈现 出 一 
套 结构 较为 清晰 ,内容 较为 集成 的 组 织 体系 ,这 是 知识 
采集 及 知识 转换 等 过 程 的 体现 2 ; 丁 村 从 关联 数据 技 
术 的 角度 入手 分 析 了 政府 信息 的 聚合 问题 ,政府 网 站 
作为 政府 信息 的 最 广泛 的 发 布 平台 ,其 信息 资源 的 聚 
合 问题 同样 符合 关联 数据 技术 角度 的 研究 ,通过 关联 
数据 技术 将 政府 外 部 信息 和 内 部 数据 整合 到 一 起 ,有 
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利于 政府 信息 资源 的 聚合 ,有 利于 用 户 和 政府 进行 科 
学 决策 ,这 是 知识 关联 等 过 程 的 体现 ; 胡 海 波 运用 
知识 融合 理论 ,提出 了 基于 知识 融合 的 电子 政务 知识 
服务 模式 , 旨 在 解决 政府 的 知识 服务 问题 ,政府 网 站 作 
为 电子 政务 建设 的 重要 组 成 部 分 ,该 知识 服务 模式 同 
样 可 以 适用 于 政府 网 站 信息 资源 的 知识 融合 ,该 模式 
体现 了 知识 抽取 、 知 识 转换 ,知识 融合 和 知识 服务 等 环 
节 5 ; 毛 秀 梅 以 政府 应 对 网 络 与 情 为 背景 ,分 析 了 知 
识 采集 、 知 识 分 析 与 表示 和 知识 关联 等 技术 ,结合 政府 
网 络 熏 情 知识 服务 流程 ,构建 了 基于 0GSA 的 网 络 与 
情 知识 服务 架构 ,这 对 于 政府 网 站 信息 资源 的 知识 融 
合 研究 具有 一 定 的 借鉴 意义 1。 本 文 在 结合 了 前 人 
研究 的 基础 之 上 ,着 眼 于 政府 网 站 信息 资源 知识 融合 
的 的 全 阶段 ,设计 出 多 维度 的 知识 融合 框架 ,并 提出 了 
相应 的 知识 融合 的 实现 方法 。 


3 ”政府 网 站 信息 资源 知识 融合 流程 分 析 
了 解 和 分 析 政府 网 站 信息 资源 知识 融合 的 流程， 
对 于 把 握 知识 融合 的 体系 架构 具有 很 强 的 指导 性 作 


用 ,本 文 以 政府 网 站 资源 本 身 所 具有 的 特性 为 出 发 点 ， 
对 其 知识 融合 的 关键 流程 进行 了 针对 性 研究 。 政 府 网 
站 信息 资源 的 知识 融合 流程 包括 4 个 重要 的 核心 过 
程 :知识 采集 、 知 识 转 换 .知识 融 合 和 知识 服务 ”。 另 
外 ,本 文 还 从 知识 的 序 化 、 重 组 和 聚 类 程度 的 角度 ,将 
整个 流程 中 的 知识 划分 为 3 个 不 同 的 阶段 , 即 广义 知 
识 分 类 知识 和 关联 聚 类 知识 。 政 府 网 站 信息 资源 知 
识 融合 流程 如 图 2 所 示 : 


op 


| 
1 1 
i I 
I I 
| ~ 知识 采集 过 程 | 
| 1 
i @ 信息 公开 类 ee i 
天 | 具有 知识 特征 的 ! 
| 广义 知识 @ 网 上 办 事 类 页 | 
| @ 公众 参与 类 | 由 下 数据 | 
' -~ 知识 转换 过 程 | 
| @ 抽取 过 小 1 
| e@ 知识 序 化 语义 知识 | 
1 @ 知识 表示 1 
a 一 一半 一 知识 融 合 过 程 | 
人 | 
yee 全 知识 关联 ”| 领域 决策 知识 i 
关联 家 类 知识 0 
| 一 -知识 服务 过 程 1 
1 
1 
1 
i 


图 2 政府 网 站 信息 资源 知识 融合 流程 
3.1 知识 采集 
原始 数据 是 整个 知识 融合 流程 得 以 运行 的 基本 单 
元 ,对 于 具有 海量 性 分散 性 、 宛 余 性 等 特点 的 政府 网 
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站 资源 来 说 ,其 网 页 所 含 的 原始 数据 信息 同样 处 于 动 
态 多样. 繁杂 和 分 布 式 的 状态 ,因此 流程 中 的 第 一 个 
步骤 是 对 处 于 这 些 状 态 的 网 站 网 页 原始 数据 进行 采 
集 。 政 府 网 站 信息 资源 包含 信息 公开 、 网 上 办 事 和 公 
众 参 与 等 版 块 ,主要 涵盖 了 政策 法 规 . 机 构 简 介 、 在 线 
咨询 .公众 论坛 特色 介绍 .统计 年 鉴 .便民 服务 等 多 个 
具体 内 容 ,在 网 页 原始 数据 的 采集 中 可 以 根据 某 一 主 
题 的 要 求 对 原始 网 页 信息 进行 初步 的 ,粗略 的 甄别 ,以 
筛选 出 具有 知识 特征 的 网 页 数据 。 
3.2 ”知识 转换 

知识 采集 过 程 已 经 对 原始 的 网 页 数据 作 了 初步 对 
别 ,并 从 中 得 到 了 具有 知识 特征 的 网 页 数据 ,知识 转换 
过 程 的 目标 就 是 将 这 些 具 有 知识 特征 的 数据 转换 为 知 
识 资源 ,来 实现 网 页 资源 内 容 的 知识 化 ”。 知 识 转换 
的 洱 段 包括 对 采集 数据 的 知识 抽取 、 知 识 过 滤 、 知 识 分 
解 \ 知 识 序 化 和 知识 表示 等 。 其 中 ,经 过 简单 的 知识 抽 
起 寺 滤 和 分 解 的 资源 还 是 处 于 一 个 杂乱 无 章 的 状态 ， 
而 简 下 来 的 知识 序 化 工作 便 通 过 对 其 进行 统一 的 资源 
内 客 描 述 变 无 序 为 有 序 ,最 后 通过 明确 的 知识 资源 表 
5 误 功 将 最 初 的 具有 知识 特征 的 网 页 数据 转换 为 具 
逻辑 性 的 语义 知识 。 
GO 知识 融合 与 知识 服务 
知识 融合 算法 是 知识 融合 的 关键 支撑 因素 。 
知识 融合 就 是 将 具有 逻辑 性 的 语义 知识 通过 算法 使 其 
为 具有 决策 支持 功能 的 领域 知识 。 在 这 一 过 程 
中 @ 宁 要 运用 一 定 的 知识 融合 算法 对 前 3 个 过 程 中 获 
取 与 处 理 过 的 知识 进行 知识 重组 \ 知 识 分 类 和 知识 聚 
类 侮 运算 。 通 过 知识 重组 对 知识 资源 进行 深度 重组 归 
类 与 合并 ,再 通过 知识 关联 将 重组 过 的 知识 进行 关联 
分 析 , 挖 掘 隐藏 在 知识 资源 中 的 序 化 的 相互 关系 ,最 
后 ,通过 知识 聚 类 将 主题 相近 或 存在 一 定 关系 的 知识 
进行 聚集 ,从 而 为 知识 服务 商定 坚实 的 基础 。 知 识 服 
务 是 整个 流程 的 最 后 一 个 环节 ,主要 目的 就 是 将 知识 
融合 完成 的 知识 提供 给 利用 者 ,从 而 为 其 提供 决策 支 


持 。 


4 政府 网 站 信息 资源 知识 融合 体系 架构 


设计 

本 文 在 结合 了 KRAFTI4 Knofuss'' .SemFus' 等 
较为 成 熟 的 知识 融合 系统 的 基础 之 上 ,从 广义 知识 、 分 
类 知识 和 关联 聚 类 知识 的 角度 切入 ,构建 了 面向 广义 
知识 的 数据 级 融合 层 , 面 向 分 类 知识 的 概念 级 融合 层 


和 面向 关联 聚 类 知识 的 决策 级 融合 层 的 3 层 体系 ， 


如 图 3 所 示 : 
; 政府 网 站 信息 资源 
re 。 知识 网 络 ， 
可 
i 上 =- 分 类 知识 
ES 组 织 体系 
! 晤 分 联 ee 2 人 
人 ee 领域 知识 si 
1 地 图 
| 次 授 妆 本 
He 国 芝 ， 知 mf 
避 1 1 
决策 级 融合 
二- 
概念 级 融合 
Eee 
数据 级 融合 
- -人 4 人 
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图 3 政府 网 站 信息 资源 知识 融合 体系 架构 


如 第 3 节 所 述 ,政府 网 站 信息 资源 在 知识 融合 过 
程 中 会 形成 广义 知识 ` 分 类 知识 和 关联 聚 类 知识 ,其 
中 ,广义 知识 形成 于 知识 采集 和 知识 转化 的 过 程 中 ,分 
类 知识 则 产生 于 知识 重组 环节 , 而 关联 聚 类 知识 则 在 
知识 关联 和 知识 聚 类 环节 中 产生 。 广 义 知 识 是 立足 于 
内 容 层面 的 宏观 性 的 概念 ,是 指 对 经 过 语义 化 技术 分 
析 的 政府 网 站 信息 资源 的 普遍 性 属性 进行 表征 后 的 知 
识 ; 分 类 知识 是 着 眼 于 结构 层面 的 知识 ,是 指 通 过 领域 
本 体 概念 合并 后 的 结构 精简 的 优化 的 知识 ;关联 聚 类 
知识 则 是 致力 于 应 用 层面 的 知识 ,是 指 对 广义 知识 和 
聚 类 知识 的 关联 和 聚 类 ,是 面向 决策 的 完整 的 领域 知 
识 。 

数据 级 融合 是 面向 广义 知识 的 融合 ,在 这 一 融合 
过 程 中 ,借助 语义 描述 等 技术 ,构造 生成 知识 网 络 ,该 
知识 网 络 的 作用 是 对 特定 主题 的 资源 进行 宏观 性 的 描 
述 ;概念 级 融合 是 面向 分 类 知识 的 融合 , 它 以 数据 级 融 
合 中 形成 的 知识 网 络 为 基础 ,运用 本 体 合 并 、 领 域 概念 
获取 等 技术 对 知识 网 络 进行 划分 ,形成 一 定 的 分 类 组 
织 体系 结构 ;决策 级 融合 是 面向 关联 聚 类 知识 的 融合 ， 
它 是 以 数据 级 融合 中 形成 的 知识 网 络 和 概念 级 融合 中 
形成 的 分 类 组 织 体系 为 依托 ,通过 知识 发 现 技术 、 知 识 
融合 算法 等 方法 ,最 终 形成 知识 地 图 ,为 利用 者 提供 其 
决策 所 需 的 知识 支持 。 
4.1 面向 广义 知识 的 数据 级 融合 

面向 广义 知识 的 数据 级 融合 是 政府 网 站 信息 资源 
知识 融合 体系 架构 的 第 一 个 层级 ,也 是 概念 级 融合 和 
决策 级 融合 的 基础 和 运行 条 件 。 数 据 级 融合 的 主要 任 
务 是 利用 RDF 链接 ,数据 关联 等 方式 实现 知识 资源 间 
初步 的 、 简 单 的 关联 融合 ,最 终 建 立 起 面向 特定 主题 的 
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政府 网 站 信息 资源 知识 网 络 ” 。 其 框架 如 图 4 所 示 : 


主题 信息 提取 与 
特征 分 析 


图 4 面向 广义 知识 的 数据 级 融合 框架 
图 4 反映 的 是 面向 广义 知识 的 数据 级 融合 的 框架 
结构 ,在 这 一 层级 中 ,主要 包括 政府 网 站 信息 资源 采集 
与 蚤 处 理 .本体 建 模 、 知 识 表示 和 知识 网 络 构 建 等 内 
窒 映 体 流程 如 下 : 


5D(1) 次 源 采集 与 对 处理。 存在 于 互联 网 中 的 政府 
网 叹 Web 网 页 中 有 大 量 的 .无 序 的 信息 ,这 些 信息 构 
成 到 资源 采集 与 预 处 理 的 资源 来 源 ,在 获取 这 些 资源 
所 和 守 要 根据 实际 需求 对 这 些 网 页 资源 的 主题 特征 值 
进香 主题 分 类 ,并 通过 灵活 使 用 自动 化 深度 标 引 、 页 面 


兴 鹿 和 网 页 切割 等 技术 ,来 完成 数据 采集 引擎 所 返回 
总 所 的 主题 信息 提取 和 特征 分 析 工作 ,然后 将 分 析 好 
的 入 


息 资源 存 人 文本 库 。 
><(2) 建 立 本 体 知识 库 。 经 过 采集 与 预 处 理 后 的 信 
息 资 源 被 存放 在 文本 库 中 ,这 时 的 信息 资源 虽 具 备 一 
定 研 度 的 主题 特征 ,但 其 还 需 进一步 的 序 化 ,由 于 元 数 
据 加 身 的 限制 性 因素 导致 其 无 法 高 效 准确 地 描述 文本 
库 中 的 政府 网 站 信息 资源 ,此 时 ,将 本 体 技术 引入 到 元 
数据 管理 中 来 ,从 SQL ,XML、RDF 数据 源 中 定位 .抽取 
和 转换 成 本 体 元 数据 ,并 以 RDF 的 形式 存储 于 本 体 知 
识 库 中 。 

(3 ) 构 建 知识 网 络 。 本 体 知识 库 中 的 以 RDF 形式 
存在 的 资源 属于 半 结构 化 的 知识 资源 ,这 时 ,可 以 引入 
“知识 元 "的 概念 ,并 结合 本 体 映射 技术 来 确定 海量 的 
政府 网 站 信息 资源 之 间 的 隐 性 关系 ,通过 本 体 语义 关 
联 方法 将 本 体 知识 库 中 半 结 构 化 的 知识 资源 通过 可 以 
被 理解 的 知识 网 络 的 形式 呈现 出 来 。 

面向 广义 知识 的 数据 级 融合 需要 借助 定 题 采集 、 
语义 描述 技术 以 及 知识 元 - 本 体 映射 技术 等 重要 方法 
和 关键 技术 来 实现 。 

(1) 定 题 采集 。 信 息 采 集 是 政府 网 站 信息 资源 知 
识 融 合 的 基础 ,政府 网 站 的 信息 资源 大 多 以 主题 的 形 
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式 分 布 和 呈现 在 网 站 页 面 中 ,针对 其 这 一 属性 特征 ,本 
文采 取 定 题 采 集 的 方法 ,利用 机 器 学 习 的 自 适 应 定 题 
采集 等 手段 ,研究 政府 网 站 主题 词 表 ,而 后 采用 基于 统 
计 的 网 页 主题 信息 提取 方法 ,利用 网 页 DOM 树 结 构 、 
页 面 去 品 、 汉 语 自 动 分 词 等 途径 实现 主题 信息 的 提取 。 
(2) 语 义 描述 技术 。 语 义 描述 技术 实现 的 是 政府 
网 站 信息 资源 主题 内 容 的 形式 化 表达 , 即 结构 化 语义 
功能 的 扩展 。 在 利用 政府 网 站 信息 资源 元 数据 标准 描 
述 政 府 网 站 信息 资源 的 基础 之 上 ,结合 本 体 技术 进行 
更 加 丰富 的 描述 ,形成 本 体 驱 动 的 元 数据 模型 ,而 后 采 
用 七 步 法 构建 领域 知识 本 体 。 

(3) 知 识 元 -本 体 映 射 技术 。 知 识 元 -本 体 映 射 
技术 实现 的 是 对 领域 知识 本 体 表征 的 知识 元 素 进 行 统 
一 对 象 化 表示 ,其 首先 要 解决 的 问题 是 知识 元 的 抽取 ， 
初步 定义 知识 元 的 语义 组 织 框架 ,而 后 利用 知识 元 - 
本 体 映 射 技术 ,将 知识 元 与 其 相对 应 的 知识 本 体 进行 
映射 ,建立 语义 链接 。 
4.2 面向 分 类 知识 的 概念 级 融合 

面向 分 类 知识 的 概念 级 融合 是 政府 网 站 资源 知 
识 融 合体 系 架 构 的 中 间 层 次 的 融合 ,起 着 承上启下 的 
作用 。 概 念 级 融合 的 主要 任务 就 是 将 知识 网 络 中 的 领 
域 概 念 关联 融合 ,完成 更 细 粒 度 的 概念 合并 ,形成 分 类 
知识 组 织 体系 ,最 终 达到 消除 元 余 的 目的 。 甚 框架 如 
5 所 示 : 


规则 


AN 


YZ 


5 面向 分 类 知识 的 概念 级 融合 框架 


在 面向 分 类 知识 的 概念 级 融合 层 中 ,主要 包括 政 
府 网 站 信息 资源 领域 概念 获取 、 领 域 本 体 概 念 关 系 识 
别 和 领域 知识 本 体 合并 等 内 容 , 具 体 流 程 如 下 : 

(1) 领 域 概念 获取 。 领 域 概念 的 获取 来 源 是 知识 
网 络 中 的 资源 , 它 包括 实体 概念 属性 概念 和 关系 概念 
3 类 中。 领域 概念 可 以 通过 利用 RDF 定义 概念 的 功 
能 ,通过 RDF 链接 .最 大 焙 模 型 和 Voronoi 图 形 化 的 方 
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法 来 进行 获取 。 

(2 ) 领 域 本 体 概念 关系 识别 。 领 域 本 体 概念 具备 
不 同 的 表现 形式 ,其 关系 类 型 包括 上 下 位 关系 、 实 例 关 
系 .序列 关系 和 定价 关系 等 ,因此 ,利用 领域 概念 抽取 
算法 ,再 结合 基于 融合 规则 的 方法 进行 规则 匹配 ,从 而 
识别 领域 概念 间 关系 ,进而 建立 领域 本 体 概念 关系 的 
层次 结构 ,是 构建 分 类 知识 组 织 体系 必 不 可 少 的 环节 。 

(3 ) 领域 知识 本 体 合并 。 领 域 本 体 概 念 间 的 关系 
被 识别 后 , 则 需要 对 这 种 关系 进行 下 一 步 的 应 用 ,在 领 
域 概念 关系 的 基础 之 上 ,通过 映射 的 方法 来 构建 领域 
知识 本 体 映 射 模型 ,进而 进行 概念 间 语 义 关 系 的 相似 
度 计算 ,完成 政府 网 站 信息 资源 领域 知识 本 体 的 合并 ， 
最 终 形成 逻辑 化 的 分 类 知识 组 织 体系 ,减少 知识 元 余 ， 
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忆 (1) 混 合式 领域 概念 获取 法 。 之 所 以 称 其 为 混合 
式 y 是 因为 此 方法 是 基于 统计 的 领域 概念 获取 算法 和 
基 习 规则 的 领域 概念 获取 算法 相 结合 的 产物 ,本文 将 
此 记 依据 政府 网 站 信息 资源 的 特征 进行 改进 ,形成 基 
了 要 体 表示 的 获取 算法 ,其 原理 如 下 :通过 RDF 链接 


PS 


进行 定性 推理 ,利用 Voronoi 图 形式 进行 定量 推理 ,使 
用 最 大 闹 模型 进行 权重 计算 ,最 后 完成 本 体形 式 表示 
下 捕 领 域 概念 的 获取 工作 。 


下 
各 


它 (2 ) 自动 抽取 算法 。 自 动 抽取 算法 主要 实现 的 是 


对 领域 本 体 概念 关系 的 识别 与 抽取 ,本 文采 用 基于 模 
式 四 配 的 算法 对 领域 资料 文本 的 对 应 关系 进行 匹配 ， 
并 采用 基于 统计 的 算法 计算 任意 概念 的 统计 度量 , 精 
准 识别 其 间 关 系 , 将 两 种 算法 相 结合 ,保证 更 为 准确 地 
识别 和 抽取 领域 概念 关系 。 

(3 ) 领域 知识 本 体 合 并 技术 。 对 政府 网 站 信息 资 
源 的 领域 本 体 进 行 合并 可 以 达到 减少 知识 网 络 中 知识 
宛 余 的 现象 ,领域 知识 本 体 的 合并 首先 要 建立 领域 本 
体 概念 分 类 体系 ;其 次 ,建立 并 利用 领域 本 体 映 射 模 型 
完成 特征 提取 .选取 概念 对 等 步 又 ;最 后 ,需要 着 重 关 
注 领域 本 体 概 念 间 语义 的 相似 度 计算 。 相 似 度 计算 的 
实现 需要 构建 由 本 体 解 析 模 块 . 本 体 库 和 语义 相似 度 
计算 等 模块 组 成 的 运算 框架 。 
4.3 面向 关联 聚 类 知识 的 决策 级 融合 

面向 关联 聚 类 知识 的 决策 级 融合 是 政府 网 站 信息 
资源 知识 融合 体系 架构 中 的 最 高 层级 ,也 是 数据 级 融 
合 和 概念 级 融合 价值 的 最 终 体现 。 这 一 层级 的 主要 任 


= 


务 是 利用 一 定 的 方法 和 算法 将 某 一 主题 的 政府 网 站 信 
息 资源 中 具有 显 性 或 隐 性 关系 的 分 散 的 领域 知识 进行 
关联 聚 类 ,为 用 户 提供 蕴含 决策 支持 功能 的 领域 知识 
地 图 。 其 框架 如 图 6 所 示 : 


[分 类 知识 组织 ee 
| Lt 中 体系 从 到 芭 
1 【ec 和 -局 

| gE, 决策 CD) 一 一 /> 知识 结 点 
i 人 


待 处 理 知识 
eo° 


6 面向 关联 聚 类 知识 的 决策 级 融合 框架 


面向 广义 知识 的 数据 级 融合 层 中 所 形成 的 知识 网 
络 和 面向 分 类 知识 的 概念 级 融合 层 中 所 形成 的 分 类 知 
识 组 织 体系 中 的 某 些 领域 知识 与 领域 知识 之 间 还 存在 
着 未 被 挖 据 和 利用 的 隐藏 关系 ,这 些 领域 知识 将 会 被 
进行 初步 选择 ,形成 待 处 理 的 知识 。 这 些 待 处 理 的 知 
识 在 面向 关联 聚 类 知识 的 决策 级 融合 层 中 将 会 得 到 深 
入 分 析 与 处 理 ,具体 内 容 如 下 : 

(1) 知 识 关联 聚 类 过 程 中 的 知识 挖掘 .关联 分 析 
和 聚 类 描述 应 用 。 政 府 网 站 信息 资源 领域 知识 关联 聚 
类 的 过 程 是 指 将 相似 性 和 关联 性 高 的 知识 群 组 划分 为 
相同 群 组 ,此 过 程 的 实现 离 不 开 知识 挖掘、 关联 分 析 和 
聚 类 描述 方法 的 应 用 ,通过 知识 控 据 手段 挖掘 出 存在 
一 定 关联 关系 的 知识 资源 群 组 ,利用 关联 分 析 将 存在 
相互 关系 的 知识 资源 群 组 的 规律 呈现 出 来 ,再 利用 聚 
类 描述 将 主题 相近 的 政府 网 站 信息 资源 知识 群 组 聚集 
在 一 起 ,形成 多 个 知识 资源 类 。 

(2) 基 于 关联 挖 据 和 语义 聚 类 的 领域 知识 融合 算 
法 应 用 。 知 识 控 据 关联 分 析 和 聚 类 描述 的 方法 可 以 
发 现 和 挖掘 领域 知识 之 间 存 在 着 的 时 序 、 因 果 以 及 凝 
聚 层 次 关系 ,这 些 关系 为 领域 知识 的 关联 和 聚 类 提供 
了 可 能 。 其 中 ,基于 时 序 关 联 的 领域 知识 融合 方法 指 
按照 时 间 序 列 的 变化 趋势 之 间 的 关系 对 领域 知识 进行 
融合 ,从 而 产生 时 序 关联 图 。 基 于 因果 关联 的 领域 知 
识 融合 方法 是 指 遵循 因果 规律 对 领域 知识 进行 融合 ， 
形成 因果 关联 图 。 基 于 凝聚 层次 聚 类 的 领域 知识 融合 
是 指 从 知识 聚 类 的 角度 出 发 对 领域 知识 进行 融合 , 形 
成 聚 类 层次 树 。 

(3) 构 建 知 识 地 图 。 本 文通 过 提取 关联 聚 类 领域 
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知识 中 的 知识 点 ,并 将 知识 点 加 以 描述 形成 知识 结 点 ， 
再 综合 利用 时 序 关联 图 .因果 关联 图 和 聚 类 层次 树 , 完 
成 领域 知识 地 图 的 构建 工作 。 知 识 地 图 是 知识 资源 展 
示 的 图 形 导 航 工 具 , 它 可 以 为 一 定 范围 内 的 用 户 提供 
基于 视图 的 知识 获取 、 交 流 和 开发 利用 服务 ”。 最 后 
面向 关联 聚 类 知识 的 决策 级 融合 为 解决 用 户 问题 提供 


的 3 个 不 同 阶段 , 即 广义 知识 阶段 .分 类 知识 阶段 和 关 
联 聚 类 知识 阶段 ,从 3 个 阶段 入 手 ,完整 设计 了 政府 网 
站 信息 资源 知识 融合 的 体系 架构 ,包括 面向 广义 知识 
的 数据 级 融合 层 .面向 分 类 知识 的 概念 级 融合 层 和 面 
向 关联 和 聚 类 知识 的 决策 级 融合 层 。 该 体系 架构 逻辑 性 
强 ,具备 一 定 的 理论 指导 意义 。 本 研究 从 宏观 角度 研 


了 资源 组 织 的 基础 ,有 利于 更 好 地 满足 用 户 的 知识 需 
求 ,提高 政府 网 站 信息 资源 的 开发 与 利用 效率 。 

同样 地 ,面向 分 类 聚 类 知识 的 决策 级 融合 的 实现 
也 离 不 开 相应 方法 和 关键 技术 的 支撑 ,例如 知识 发 现 
技术 .知识 融合 算法 以 及 可 视 化 与 人 工交 互 技术 的 应 
用 等 。 

(1) 知识 发 现 技术 。 知 识 发 现 技术 主要 实现 了 政 
府 网 站 信息 资源 领域 知识 的 关联 桶 类 流程 ,通过 面向 
文 窗 内 容 和 面向 网 络 结构 的 知识 挖掘 技术 , 挖 据 出 政 
府 网 站 中 存在 一 定 关联 关系 的 知识 资源 ,再 利用 知识 
半身 技术 , 设 定 相应 的 关联 规则 ,运用 多 重 运算 对 挖 所 
时 而 知识 资源 进行 关联 分 析 , 最 后 选 定 “ 聚 类 阔 值 ”分 
解 知识 对 象 集合 ,运算 “ 聚 类 近似 值 ”, 进 行 知识 聚集 ， 
开 席 知识 资源 类 。 
7(2) 知 识 融 合算 法 。 本 文 主要 采用 时 序 关联 融合 
个 油 、 因 果 关联 时 序 算法 和 凝聚 层次 聚 类 融合 算法 ,分 
中 次 时 间 序列 、 因 果 关 系 涯 聚 层次 的 角度 实现 政府 网 
站 得 息 资 源 的 关联 聚 类 知识 的 融合 。 
>S(3) 可 视 化 与 人 工交 互 技术 。 可 视 化 与 人 工交 互 
技术 具备 智能 化 的 特点 ,可 以 更 好 的 帮助 用 户 享受 知 
识 融合 的 成 果 。 例 如 ,基于 前 文中 的 政府 网 站 信息 次 
源 知 识 融合 的 脉络 ,建立 知识 地 图 或 知识 图 谱 ,为 用 户 
提供 立体 .交互 .可 视 化 的 决策 支持 ,帮助 用 户 直 观 地 
在 短 时 间 内 获取 所 需 的 知识 资源 。 


在 信息 化 浪潮 的 席卷 下 ,政府 网 站 信息 资源 的 规 
模 正 以 几何 式 的 增长 速度 不 断 扩大 ,日 益 呈 现 出 海量 
性 、 异 构 式 、 分 散 性 等 特点 ,在 此 背景 下 ,政府 网 站 信息 
资源 的 价值 需求 也 在 不 断 升级 ,如 广泛 性 需求 ,多 样 化 
需求 精准 化 需求 和 综合 性 需求 等 。 为 了 降低 政府 网 
站 信息 资源 海量 性 等 固有 制约 因素 带 来 的 影响 并 实现 
政府 网 站 信息 资源 的 价值 需求 ,需要 架构 一 套 完整 的 
应 对 体系 。 本 文 从 “知识 融合 ”的 视角 切入 ,在 整合 了 
前 人 相关 研究 的 基础 之 上 ,从 知识 采集 、 知 识 转 换 、 知 
识 融合 和 知识 服务 4 个 过 程 分 析 了 政府 网 站 信息 资源 
知识 融合 的 流程 ,并 从 流程 分 析 中 划分 出 了 领域 知识 
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究 了 政府 网 站 信息 资源 的 体系 架构 问题 ,但 事实 上 , 关 
于 政府 网 站 信息 资源 知识 融合 的 建设 也 需要 注重 微观 
层面 的 研究 ,具体 融合 算法 实例 验证 以 及 测评 等 方面 
的 研究 将 成 为 接 下 来 的 研究 方向 。 
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bstract: [Purpose/significance | From the perspective of knowledge fusion, this paper try to solve the contradic- 


tion between the scattered and massive information resources on government websites and the integrated and precise knowl- 


edge needs of the public ，so that can provide decision support for users and improve the utilization efficiency of information 


resources on government websites. [Method/process | Firstly, this paper explained the connotation and value require- 


ments of government website information resources, and reviewed the research progress of knowledge fusion. Then, it ana- 


lyzed the knowledge fusion process of government website information resources. Finally, based on the process analysis, it 


designed a knowledge fusion system architecture of government website information, which involves several levels included 


“ data level fusion -concept level fusion -decision level fusion” , and we also built appropriate operational framework for each 


specific level. [ Result/conclusion | The knowledge fusion system architecture of government website information we de- 


signed provides theoretical and referential support for scalable and in-depth research subsequently. 
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